iT邦幫忙

2024 iThome 鐵人賽

DAY 28
0

今天要來講在Pandas自訂資料index索引值,
那麼直接來看範例吧。

範例

首先,先建立一個DataFrame結構的資料,
或是有匯入的資料轉成DataFrame結構也行。
這邊為了方便對照,先印出完整的資料來看。

studentsData = {
    'studentId': ['001', '002', '003'],
    'Name': ['A', 'B', 'C'],
    'Height': [175, 153, 164],
    'Weight': [80, 45, 75],
    'City': ['New York', 'Los Angeles', 'Chicago']
}
students = pd.DataFrame(studentsData)
print(students)

印出資料如下,
可以看到系統已自動將資料預設index數值0、1、2。

  studentId Name  Height  Weight         City
0       001    A     175      80     New York
1       002    B     153      45  Los Angeles
2       003    C     164      75      Chicago
自訂資料索引值

在自訂index索引值時
可以是字串,
也可以是數字,
甚至是混用都沒問題,
這裡強烈不建議混用型別在index上
因為在做資料排序或是處裡時反而容易遇到困難,
在識別時也不好維護。

字串index索引值

首先做字串的index索引值,
這裡順序刻意將順序打亂。

students.index = ["id3", "id1", "id2"] 
print(students)

印出資料如下。
可以看到資料順序不變,
僅有index索引值被改為自訂的。

    studentId Name  Height  Weight         City
id3       001    A     175      80     New York
id1       002    B     153      45  Los Angeles
id2       003    C     164      75      Chicago
數字index索引值

接著做數字的index索引值,
這裡順序刻意將順序打亂。

students.index = [2, 0, 1]
print(students)

印出資料如下。
可以看到資料順序不變,
僅有index索引值被改為自訂的。

  studentId Name  Height  Weight         City
2       001    A     175      80     New York
0       002    B     153      45  Los Angeles
1       003    C     164      75      Chicago

今日結語

今天教大家自訂index索引值是為了之後排序會用到,
另外這裡呼籲大家,
在自訂index索引值時千萬不要隨便命名喔。


上一篇
DAY27 Pandas使用drop_duplicates刪除重複
下一篇
DAY29 Pandas使用sort_index排序
系列文
走在Pandas資料操縱與分析的路上持續前進30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言